Tableau 2024.1新機能!Excelの取り込み開始行指定と重複行の識別が可能になりました #tableau
2024年2月21日にTableau 2024.1が公開されました。その中で気になった、Tableau Prep Builder のデータ加工における新機能について紹介していきます!
Tableau Prep Builder 2024.1 で利用できる新機能
Tableau 2024.1 のアップデートのメインはTableau Pulseのリリースでした!しかし、それ以外にも便利な機能がリリースされているようです。Tableau Prep Builder 2024.1 では以下の機能がリリースされていました。
- 取り込むExcelファイルのヘッダーと開始行の選択
- 重複行の識別
- Splunk JDBC コネクタ
この中で、Excelの取り込みと重複行の識別機能について試してみたので、記載していきます。
取り込むExcelファイルのヘッダーと開始行の選択
データサンプル
以下ようなExcelで管理された帳票を取り込むケースを想定します。
取り込んでみた
- データ取り込みの設定画面に、『ヘッダーオプション』が追加されていました
- ヘッダーを設定の選択をし、それぞれ設定を行います
- データを確認すると、任意の位置からデータが読み込まれていることが確認できました!
従来のデータインタープリター機能も便利ではあったものの、うまく読み込めないファイルや任意に設定したい場合にとても便利ですね。
重複行の識別
先ほどのデータを確認すると、キッズブランドB
のデータが重複してしまっていることがわかります。これを新機能を使って削除してみましょう!
クリーニングステップから重複行を識別
- まず、取り込んだデータにクリーニングステップを接続します
- そうすると、設定画面に『重複行の特定』のオプションが追加されていました
- 重複行の特定をクリックし、計算フィールドを追加すると、
一意/重複
の値が入力されています。ここには、取り込んだデータ列の組合せで完全に重複する値がある場合重複
と入力されるようです
重複
をアクティブにして、「除外」を選択してみます
- そうすると、重複分だけが除外されて一意にされたデータのみを残すことができました!
さいごに
いかがでしたでしょうか。Tableau Prepはシンプルな操作感ながらも、便利な機能がどんどん追加されていますね。是非試してみてください!